Mamba és una arquitectura d'aprenentatge profund centrada en el modelatge de seqüències. Va ser desenvolupat per investigadors de la Universitat Carnegie Mellon i la Universitat de Princeton per abordar algunes limitacions dels models de transformadors, especialment en el processament de seqüències llargues, i es basa en el model de seqüència d'espai d'estat estructurat (S4).[1][2]
© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search